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摘 要 : 为 了 提高 卷 积 神经 网 络 对 图 像 分 类 的 正确 率 ， 对 网 络 结构 进行 研究 ， 提 出 了 多 模型 融合 卷 积 神 经 网 络 。 通 过 
提取 单个 模型 的 输出 特征 向 量 ， 进 行 融合 后 得 到 新 的 输出 特征 向 量 ， 再 搭建 单 层 分 类 器 进行 图 像 分 类 ， 提 高 分 类 准确 
率 。 将 单个 模型 与 多 模型 融合 的 分 类 准确 率 进 行 比较 ， 多 模型 融合 卷 积 神 经 网 络 的 分 类 准确 率 有 所 提高 。 并 分 析 了 卷 
积 神经 网 络 最 后 一 层 全 连接 层 的 权 值 分 布 ， 发 现 同一 模型 在 不 同 数据 集 上 权 值 分 布 曲线 相似 ， 分 类 效果 好 的 网 络 模型 
其 权 值 分 布 曲线 更 平缓 。 
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Research on multi-model classification algorithm based on weight distribution 


Jiang Mengying'’, Lin Xiaozhul, Ke Yanl 2 Wei Zhanhong! 
(1. College of Information Engineering, Beijing Institute of Petrochemical Technology, Beijing 102617, China; 2. College of 
Information Science & Technology, Beijing University of Chemical Technology, Beijing 100029, China) 


Abstract: To improve the correct rate of image classification by convolutional neural network, a multi-model fusion 
了 convolutional neural network is proposed after research on the network structure. By extracting the output feature vectors of a 
single model and then fusion them, the new output feature vectors are obtained, and then a single classifier is set up to classify 


the images, and the accuracy of the classification is improved. The classification accuracy of single model compare with multi- 


yn- model fusion, the accuracy of classification of multi-model fusion convolutional neural network is improved. The weight 


distribution of the last layer of the convolutional neural network is analyzed, and it is found that the weight distribution curve 


of the same model on different data sets is similar and the weight distribution curve of the network model with better 
classification effect is more gentle. 


= 一 Key words: convolutional neural network; multi-model fusion; feature vector; feature extraction; weight distribution 


0 a Szegedybl] 等 人 增加 了 CNN 的 深度 ,提出 了 超出 20 层 的 CNN 结 
构 GoogLeNet 模型 -Simonyan 等 人 四 对 CNN 的 深度 进行 研究 ， 

图 像 的 特征 提取 和 分 类 一 直 以 来 都 是 计算 机 视觉 领域 一 个 ” 提出 了 VGGNet 模型 ， 通 过 不 断 增加 3x3 卷 积 核 的 卷 积 层 来 增 

基础 且 重 要 的 研究 方向 。 深 度 学 习 是 近 十 余年 来 人 工 智 能 领域 ”加 网 络 的 深度 。2015 年 ，He 等 人 外 提出 深度 为 152 层 的 残 差 网 

取得 的 重要 突破 ， 其 卷 积 神经 网 络 在 图 像 分 类 上 具有 显著 效果 。 ” 络 在 LSVRC-15 的 图 像 分 类 竞赛 中 获得 了 第 一 名 。 随 着 卷 积 家 

络 结构 的 不 断 加 深 , 模型 需要 海量 的 数据 输入 。 由 于 数据 集 
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卷 积 神经 网 络 (convolutionalneural network，CNN ) 能 从 原始 输 经 
入 图 片 中 挖掘 抽象 的 特征 信息 ， 得 到 的 特征 表示 具有 良好 的 泛 数量 有 限 , 训练 网 络 存在 梯度 弥散 和 过 拟 合 中 等 问题 ， 导 致 图 
化 能 力 。1998 年 LeCun 提出 了 LeNet-5 网 络 结构 中 标志 着 CNN ”分 类 的 准确 率 下 降 。 对 此 , 研究 者 们 提出 了 许多 解决 办 法 。 在 网 
的 真正 面世 , 但 此 时 的 CNN 只 适用 于 小 图 片 的 识别 ， 对 于 大 规 络 结 构 方 面 ， 通 过 改变 网 络 的 激活 函数 由、 引入 dropout 层 吴 、 
模 的 数据 输入 ， 识 别 效果 较 差 。 直 至 2012 年 ，krizhevsky 等 人 迁移 学 习 、 并 行 交 叉 CNN 模型 四 和 本 文 前 期 工作 一 一 跨 连 接 0 
站 设计 的 AlexNet 卷 积 神 经 网 络 结构 在 ImageNet 图 像 竞赛 等 方法 来 提高 模型 对 特征 的 表达 能 力 ， 进 而 提高 图 片 分 类 的 准 
(ImageNet Large Scale Visual Recognition Challenge,LSVRC) 中 确 率 。 本 文 首先 提出 一 种 多 模型 融合 的 卷 积 神经 网 络 来 进行 图 
取得 冠军 , 使 CNN 得 到 越 来 越 多 的 研究 者 们 的 重视 。2014 年 ， 像 分 类 ， 将 数据 集 采用 迁移 学 习 [ 由 在 几 个 现 有 的 卷 积 神经 网 络 
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模型 中 进行 训练 ， 并 分 别提 取 训 练 后 模型 的 最 后 一 层 全 连接 层 。 学 习 后 的 最 后 一 层 全 连接 层 输出 特征 向 量 ， 然 后 将 得 到 的 不 同 
输出 特征 向 量 。 将 几 个 模型 提取 出 的 特征 向 量 进行 融合 , 使 用 融 。” 模型 的 输出 特征 向 量 进行 融合 后 ， 再 搭建 新 的 单 层 分 类 器 进行 
合 后 的 特征 向 量 进行 Softmax 分 类 , 提高 分 类 准确 率 , 并 通过 实 。” 分类， 其 模型 结构 如 图 2 所 示 。 

验 验证 了 方法 的 可 行 性 。 然 后 对 单 模型 和 多 模型 的 最 后 一 层 

连接 层 的 权 值 分 布 曲线 进行 分 析 。 


1 ”多 模型 融合 卷 积 神经 网 络 


卷 积 神经 网 络 可 以 直接 输入 原始 图 像 ， 避 免 了 图 片 复杂 的 
前 期 预 处 理 ， 不 需要 人 为 地 进行 特征 提取 ， 有 具有 良好 的 特征 表 
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全 224x224x3 224x224x64 


7x7x512 


1x1x4096 1xlx1000 
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达能 力 02。 卷 积 神经 网 络 主要 包括 卷 积 层 、 下 采样 层 、 局 部 响 Ea 

应 归 一 化 (localresponse normalization，LRN) 层 [3、 全 连接 层 toy connectedrReLU 

和 Softmax 分 类 层 ， 其 中 卷 积 层 和 池 化 层 是 卷 积 神经 网 络 的 重 Eve 

要 组 成 部 分 。 卷 积 神经 网 络 的 训练 过 程 主要 包括 前 向 传播 和 反 四 1 VGG-16 模型 结构 图 

向 传播 两 个 过 程 和 ,主要 是 学 习 卷 积 层 的 卷 积 核 参 数 和 层 间 连 Fig.16 model 

接 权 重 等 网 络 参数 。 Image 

1.1 AlexNet 模型 和 VGG 模型 > 

1.1.1 AlexNet 模型 Ns pw [om5)] fo) mo [Ga 
AlexNet 模型 解决 了 之 前 卷 积 神经 网 络 只 能 满足 小 尺寸 图 Ne A ss 

片 输入 的 问题 ， 并 证 明了 CNN 在 复杂 模型 下 的 有 效 性 。 相 较 

于 传统 的 卷 积 神经 网 络 , AlexNet 模型 在 网 络 模型 结构 、 激 活 函 was | 

数 以 及 引入 Dropout 层 等 方面 进行 了 改进 。AlexNet 模型 增加 | 

了 网 络 模型 层 数 ， 更 深 的 模型 结构 使 其 具有 更 好 的 特征 提取 和 SofiMax 

特征 表达 能 力 。 局 部 响应 归 一 化 是 对 特征 图 相 邻 区 域 或 者 相 邻 图 2 多 模型 融合 结构 图 

特征 图 的 响应 进行 归 一 化 操作 ,起 到 相 邻 响应 相互 抑制 的 作用 。 Fig.2 Multi-model fusion structure diagram 

在 激活 函数 方面 ， 据 弃 了 传统 的 sigmoid 激活 函数 和 tanh 激活 将 不 同 网 络 模型 的 输出 特征 向 量 进行 融合 后 ， 增 加 的 输出 


函数 ,采用 ReLU 分 段 线性 激活 函数 , 使 得 网 络 能 够 快速 收敛 ， 特征 向 量 参与 最 后 分 类 器 的 分 类 , 对 分 类 正确 率 有 一 定 的 提高 。 
提供 了 神经 网 络 的 稀 玻 表达 能 力 并 且 有 效 缓解 了 梯度 消失 的 问 同时 ， 在 获取 不 同 模型 的 输出 特征 向 量 时 ， 仅 采用 预 训 练 模型 
题 。 在 全 连接 层 采 用 Dropout， 即 在 训练 过 程 中 ,按照 一 定 的 概 ”微调 网 络 参 数 后 来 得 到 最 后 一 层 全 连接 层 网 络 的 输出 特征 向 量 。 
率 将 部 分 神经 网 络 单元 随机 暂时 的 从 网 络 中 丢弃 ， 增 强 了 模型 ”融合 不 同 模型 的 输出 特征 向 量 后 ， 只 需要 进行 单 层 分 类 器 训练 
的 泛 化 能 力 ， 改 善 模型 过 拟 合 的 问题 。 分 类 ， 一 定 程度 的 减少 了 计算 量 ， 对 训练 时 的 硬件 要 求 降低 。 
1.1.2 VGGNet 模型 

VGGNet 模型 是 AlexNet 模型 发 展 而 来 的 网 络 模型 ， 主 要 2 同属 光 全 分机 
展示 出 网 络 的 深度 是 算法 优良 性 能 的 关键 部 分 。VGGNet 主要 通过 对 卷 积 神经 网 络 的 结构 分 析 ， 可 以 发 现 卷 积 神经 网 络 
在 两 方面 提出 了 改进 :所 有 的 卷 积 核 大 小 都 使 用 3x3 尺寸 大 小 ; 的 卷 积 层 和 池 化 层 的 作用 由 在 提取 图 像 特征 ， 卷 积 神经 网 络 后 
在 整个 图 片 和 multi-scale 上 训练 和 测试 图 片 。VGGNet 根据 网 几 层 全 连接 层 的 作用 则 是 将 提取 的 特征 变换 得 到 一 维 的 输出 特 


曙 | 


络 层 数 不 同 有 多 种 模型 ， 常 使 用 的 为 VGG-16 模型 ， 其 结构 图 向量 。 最 后 一 层 全 连接 的 输出 特征 向 量 的 每 个 单元 可 以 看 做 
如 图 1 所 示 。 训练 样本 中 含有 的 特征 ， 经 过 最 后 一 层 全 连接 层 后 得 到 一 个 


hs 


1.2 多 模型 融合 卷 积 神经 网 络 任 向 量 (1*n)， 其 中 为 样本 数据 集 的 类 别 数 。 网 络 的 最 

训练 卷 积 神经 网 络 模型 时 常 出 现 模型 过 拟 合 的 问题 ， 导 致 ” 层 全 连接 层 的 作用 实际 是 对 特征 向 量 进行 分 类 。 对 最 后 一 
网 络 模型 对 图 像 分 类 的 正确 率 降低 。 由 于 输入 图 片 的 数量 有 限 ， ”连接 层 进行 研究 ， 获 取 网 络 模型 的 最 后 一 层 权 值 参数 ， 并 对 其 
而 网 络 结构 参数 多 ， 特 征 向 量 在 进行 分 类 时 全 连接 层 参 数 容易 ” 权 值 参数 分 布 进行 分 析 。 假 设 输出 特征 向 量 单元 数 为 4096 个 


MU dl\ 


出 现 元 余 。 单元 ， 最 后 一 层 全 连接 层 过 程 如 图 3 所 示 。 
对 网 络 模型 的 全 连接 层 分 析 发 现 ， 改 善 模 型 过 拟 合 现象 提 中 ， 全 连接 层 的 输入 为 {V, 训 XZ,…,X40%} ， 输 出 为 


高 分 类 正确 率 方法 主要 分 为 减少 全 连接 层 权 值 参 数 和 增加 输出 。”{azaz,.…,an}，n 表示 分 类 任务 的 类 别 数 ，w 为 全 连接 层 的 权 值 
特征 向 量 两 方面 。 在 这 基础 上 ， 提 出 一 种 多 模型 融合 的 卷 积 参数 。 那 么 ， 全 连接 层 也 可 以 用 一 个 多 维 方程 组 表示 ， 如 下 式 
经 网 络 模型 ， 对 同一 训练 数据 集 ， 提 取 不 同 网 络 模型 经 过 迁移 所 示 : 
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2017 百度 图 像 竞 赛 数据 集 为 100 类 不 同 品种 的 狗 狗 图 片 ， 
数据 集 如 图 5 所 示 。 其 中 , 训练 集 数 量 为 8153 张 , 测试 集 数量 
为 10 624 张 ， 每 类 有 30~200 张 。 


* 
A=Wii * + Wi NX 十 .+ Wi go096 * Xa096 + Db 
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二 米 
33 三 W31 如 下 Ws2 7 十 … 十 W3,4096 Xa096 十 已 


中 亚 牧 羊 犬 中 华 田园 厂 。 中国 冠 毛 厂 。。 中国 昆明 大 。 中 国 沙 皮 犬 中国 细 大 


SS my 加. 
"| Ww 明 
ae， » 起. hn 
Ee -Ur ' 人 pA 
通过 公式 可 知 ， 每 一 种 分 类 类 别 都 是 由 4096 个 特征 按照 :A 2 


ey a ys 迪 丁 康 京 家 比 沙 猪 厂 俄罗斯 南部 牧羊 犬 俄 加 索 大 
一 定 的 权 值 比重 组 成 的 。 在 进行 分 类 时 ， 通 过 分 析 可 知 ， 全 连 RE Eee 


激活 小 于 等 于 零 的 值 经 过 ReLU 激活 函数 后 被 置 零 ， 只 保留 大 
于 零 的 净 激 活 值 。 那 么 实际 上 ， 在 最 后 一 层 全 连接 层 进行 分 类 二 


接 层 输入 与 权 值 相 乘 得 到 的 净 激活 再 经 过 ReLU 激活 函数 ， 净 人 h 和 


时 ， 只 有 部 分 的 输出 特征 决定 着 分 类 类 别 。 所 以 ， 最 后 一 层 全 -> 好 得 
连接 层 的 权 值 分 布 情况 很 大 程度 上 决定 着 模型 分 类 的 效果 。 BR 
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图 5 2017 百度 图 像 竞赛 数据 集 部 分 图 
Fig.5 Partial pictures of 2017 Baidu image competition dataset 
3.2 实验 结果 及 分 析 
3.2.1 多 模型 融合 
本 文 将 Caltech-101 数据 集中 每 类 随机 选取 出 30 幅 图 像 作 
为 训练 样本 , 剩余 部 分 作为 测试 样本 。 将 2017 百度 图 像 竞赛 数 
据 集 训练 集 8153 张 图 片 进行 训练 ， 测 试 集 10 624 张 图 片 进行 
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又 2 
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0 测试 。 首 先 对 图 像 进行 预 处 理 ， 将 数据 集 所 有 图 片 缩放 为 
图 3 全 连接 层 结构 图 256*256 像素 大 小 的 图 像 块 。 由 于 从 ImageNet 数据 集 上 学 习 得 
Fig.3 Full connect layer structure diagram 到 的 底层 滤波 器 往往 描述 了 各 种 不 同 的 局 部 边缘 和 纹理 信息 ， 


3 ”实验 分 析 这 些 滤波 器 对 一 般 的 图 像 有 较 好 的 普 适 性 。 在 不 同 模型 提取 最 
后 一 层 全 连接 层 输出 向 量 时 , 均 采 用 各 个 模型 在 ImageNet 数据 
3.1 实验 数据 集 集训 练 过 后 的 参数 作为 初始 权 值 参数 ， 然 后 使 用 输入 数据 集 对 
本 实验 分 别 采用 Caltech-101 数据 集 03 和 2017 年 百度 图 像 ” 网 络 模型 进行 微调 。 使 用 CaffeNet 模型 进行 微调 提取 输出 特征 
竞赛 数据 集 进行 实验 。Caltech-101 数据 集 是 由 李 飞 飞 等 人 于 ”向 量 时 ， 对 输入 图 像 进行 处 理 得 到 227*227 像素 的 图 像 ， 然 后 
2003 年 在 加 州 理工 学 院 创 建 的 数字 图 像 集 。 Caltech-101 数据 身 对 所 有 图 像 进行 减 均值 处 理 。CaffeNet 模型 与 AlexNet 结构 模 
9146 张 图 片 ， 包 括 101 类 前 景 图片 和 一 个 背景 类 。 每 类 有 型 基本 相似 ， 区 别 在 于 LRN 层 的 位 置 不 同 。AlexNet 结构 中 ， 
30~800 张 图 片 ， 大 部 分 图 片 有 50 张 。 图 4 为 Caltech-101 数据 ” LRN 层 是 在 池 化 层 之 前 ， 而 CaffeNet 结构 中 ，LRN 层 则 在 池 
集 的 一 部 分 示例 图 片 。 化 层 之 后 。 使 用 VGG-16 网 络 模型 进行 微调 提取 输出 向 量 时 ， 
则 截取 224*224 像素 的 图 像 输入 。 初 始 学 习 率 为 0.0001， 每 迭 
代 1000 次 学 习 率 减少 10 倍 ， 训 练 过 程 总 迭代 次 数 为 8000 次 。 
将 两 个 网 络 模型 融合 后 , 得 到 输出 向 量 为 8192 个 单元 ,再 进行 
单 层 的 Softmax 分 类 器 分 类 。 
| Caltech-101 数据 集 在 CaffeNet 网 络 模型 提取 输出 特 
征 向 量 进 行 单 层 分 类 器 训练 、 在 VGG-16 网 络 模型 提取 输出 
征 向 量 进 行 单 层 分 类 器 训练 、 将 两 个 模型 的 输出 特征 向 量 融 
kangaroo lamp mandolin nautilus 后 进行 单 层 分 类 器 训练 ， 其 测试 集结 果 如 表 1 所 示 。 


panda 
| | ( AN 表 1 不 同 模型 在 Caltech-101 数据 集 上 的 分 类 正确 率 
wf “~® 多 网 络 模型 正确 率 (%) 


CaffeNet 模型 79.02 
图 4 ” Caltech-101 数据 集 的 部 分 图 片 VGGNet 模型 82.25 
Fig.4 Partial pictures of Caltech-101 dataset 多 模型 融合 83.89 
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将 2017 百度 图 像 竞赛 数据 集 在 CaffeNet 模型 提取 输出 特 


征 向 量 进行 单 层 分 类 器 训练 、 
征 向 量 进行 单 层 分 类 器 训练 以 


在 VGG-16 网 络 模型 提取 输出 特 
及 将 两 个 模型 的 输出 特征 向 量 融 


合 后 进行 单 层 分 类 器 训练 ， 其 


测试 集结 果 如 表 2 所 示 。 


表 2 不 同 模型 在 2017 百度 图 像 竞赛 数据 集 上 的 分 类 正确 率 


网 络 模型 正确 率 (%) 
CaffeNet 模型 39.05 
VGGNet 模型 42.88 
多 模型 融合 45.67 
对 两 个 数据 集 分 别 进行 多 个 模型 训练 后 ， 测 试 结果 表明 : 


同一 训练 样本 数据 集 ，VGG- 
CaffeNet 模型 ， 多 模型 融合 后 
练 的 分 类 准确 率 。 


16 模型 训练 后 分 类 正确 率 高 于 
， 分 类 正确 率 均 高 于 单个 模型 训 


3.2.2 最 后 一 层 全 连接 层 权 值 分 析 


通过 上 一 节 实 验 可 以 得 到 


(a)Caltech-101 数据 集 的 权 值 分 布 


己 经 训练 好 的 不 同 卷 积 神经 网 络 
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模型 ， 分 别提 取 其 最 后 一 层 全 连接 层 的 权 值 ， 将 它们 按照 大 小 


顺序 绘 秆 


出来。 其 中 ，CaffeNet 模型 在 Caltech-101 数据 集 与 


2017 百度 图 像 竞 赛 数 据 


布 如 图 6 所 示 。 
图 6 中 ， 横 多 


上 训练 后 最 后 一 层 全 连接 层 权 值 分 


标 为 最 后 


层 全 连接 层 特征 向 量 的 维度 ， 


般 情况 下 输出 向 量 的 单元 数 为 4096, 横 坐 标 范围 为 (0,4500)。 


纵 坐 标 为 最 后 一 层 全 连接 层 的 权 值 参数 值 ， 其 范围 为 〈-0.06， 


0.08)。 对 比 同 一 模型 在 不 同 数据 集 上 的 最 后 一 层 权 值 分 布 曲线 ， 


可 以 得 到 ， 同 一 模型 在 不 


司 数据 集 上 的 权 值 分 布 曲线 相似 。 


分 别 绘制 CaffeNet 模型 和 VGG-16 模型 在 Caltech-101 数 


据 集 上 最 后 一 层 全 连接 层 权 值 分 布 曲线 ， 如 图 7 所 示 。 通 过 分 


析 不 同 模型 在 同一 数据 集 上 的 最 后 一 层 权 值 分 布 ， 可 以 得 到 ， 
VGG-16 模型 相 较 于 CaffeNet 模型 ， 其 最 后 一 层 全 连接 层 的 权 
值 参 数 分 布 更 平缓 。 


-0.06 


(b) 2017 百度 竞赛 数据 鲁 
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(b) 2017 Baidu image competition dataset 


图 6 CaffeNet 模型 在 不 同 数据 集 上 的 最 后 一 层 全 连接 层 权 值 分 布 


区 | 


Fig.6 The last layer full connected weight distribution on different data sets on CaffeNet model 
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图 7 不 同 模型 在 Caltech-101 数据 集 上 的 最 后 一 层 全 连接 层 


权 值 分 布 


线 图 


Fig.7 The last layer full connect layer weight distribution of different models on Caltech-101 dataset 


0.1)。 由 于 2017 年 百度 图 像 竞赛 数据 集 相 较 于 Caltech-101 数 


对 于 多 模型 融合 卷 积 神经 网 络 模型 则 同样 提取 其 分 别 在 


Caltech-101 数据 集 和 2017 百 
值 分 布 曲线 ， 如 图 8 所 示 。 图 


度数 据 集 上 训练 后 的 最 后 一 层 权 
中 横 坐 标 为 最 后 一 层 全 连接 层 特 


征 向 量 的 维度 ， 由 于 多 模型 融 
以 其 多 模型 的 特征 向 量 维度 为 
纵 坐 标 为 最 后 一 层 全 连接 层 的 


合 了 两 个 单 模型 的 输出 向 量 ， 所 
8192, 横 坐 标 范围 为 (0, 10000 )。 
权 值 参数 值 , 其 取 值 范围 为 (-0.2， 


据 集 来 说 ， 其 数 


注 


居 未 经 过 


青 洗 ， 


图 片 质量 不 好 ， 所 以 分 类 正确 


率 低 。 通 过 对 比 多 模型 融合 卷 积 神经 网 络 模型 在 两 个 数据 集 | 


的 权 值 分 布 曲线 ， 可 以 发 现 多 模型 融合 后 权 值 分 布 取决 于 数 ] 
集 的 质量 ， 曲 线 总 体 相 似 ， 当 数据 集 质量 越 好 ， 分 类 曲线 越 
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(b) 2017 Baidu image competition dataset 
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图 8 融合 模型 在 不 同 数据 集 上 的 最 后 一 层 全 连接 层 权 值 分 布 曲线 图 


Fig.8 The last layer full link layer weight distribution of fusion models on different datasets 


4 ”结束 语 


卷 积 神经 网 络 的 特点 是 能 够 自动 地 、 隐 式 地 学 习 特 征 ， 不 
需要 人 为 地 定义 特征 。 当 有 足够 多 的 样本 进行 训练 时 ， 网 络 可 
以 学 习 到 很 好 的 特征 来 进行 分 类 。 由 于 网 络 权 值 参数 过 多 ， 训 
练 样本 少 ， 网 络 模型 易 出 现 过 拟 合 问题 ， 分 类 正确 率 降 低 。 网 
络 模型 结构 复杂 ， 计 算 量 大 ， 硬 件 设 施 要 求 较 高 。 本 文 首先 提 

多 模型 融合 的 卷 积 神经 网 络 模型 ， 其 分 类 准确 率 较 于 单个 模 
型 有 一 定 的 提高 。 由 于 多 模型 融合 后 ,只 需 进行 单 层 网 络 训练 ， 
对 于 硬件 设施 要 求 也 降低 ， 计 算 速 度 也 得 到 提高 。 然 后 对 卷 积 
神经 网 络 的 最 后 一 层 全 连接 层 进 行 分 析 ， 发 现 同一 模型 在 不 同 
数据 集 上 最 后 一 层 全 连接 层 权 值 分 布 曲线 相似 ， 不 同 模型 在 相 
同 数据 集 上 的 最 后 一 层 全 连接 层 权 值 分 布 曲线 有 差异 。 多 模型 
融合 后 权 值 分 布 则 与 数据 集 的 质量 有 关 ， 质 量 越 好 分 类 曲线 越 
平缓 ， 而 且 一 致 性 较 好 。 
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